🌤->⛅
TASK | 状态 | 预计耗时 |
---|---|---|
并行处理大作业:多节点测试HPL | queue | 10h |
总计 | 10h | |
测试发现--cpus-per-task并没有真正控制每个mpi进程占用的core数,事实上它根本不起作用,这是为什么? | ||
怀疑我们之前跑的hpl实际上都占用了96个核而不是48个核,每个task并不像网传资料那样默认占用1个核,且sbatch参数也不能进行控制,这是为什么? | ||
不能精确控制所用核数就不能计算理论峰值,实验也就没有意义了。。。 |
实际上
TASK | 状态 | 实际耗时 |
---|---|---|
并行处理大作业:多节点测试HPL | run | 10h |
总计 | 10h |